检索结果

Select

1. 基于查询扩展的人名消歧

杨欣欣李培峰朱巧明

计算机应用 2012, 32 (09): 2488-2490. DOI: 10.3724/SP.J.1087.2012.02488

摘要（865）

PDF （613KB）（568）

针对现有很多基于特征的人名消歧方法不适用于文档本身特征稀疏的问题,提出一种借助丰富的互联网资源,使用搜索引擎查询并扩展出更多与文档相关特征的方法。首先根据搜索引擎的特性构建了四类查询规则,然后通过这些查询规则进行搜索并返回前 k个文档,最后对这些文档使用文档频率(DF)方法进行特征选择,并将选择的特征加入到原文档中。实验证明,该方法能显著提高人名消歧系统的性能,平均 F值由76%增加到81%。

参考文献 | 相关文章 | 多维度评价

Select

2. 中文名词性谓词语义角色标注的特征研究

徐靖李军辉朱巧明李培峰

计算机应用 2011, 31 (06): 1671-1674. DOI: 10.3724/SP.J.1087.2011.01671

摘要（1789）

PDF （856KB）（349）

在语义角色标注中，相对于动词性谓词，名词性谓词与其角色之间的结构更灵活和复杂。为了更好地捕获这些结构化信息，通过对名词性谓词语义角色标注相关特征集的研究，探索了新的单词特征和句法特征，用于名词性谓词语义角色标注。基于正确句法树和正确谓词识别，中文名词性谓词语义角色标注的F1值达到了73.99,优于目前国内外的同类系统；基于自动句法树和自动谓词识别，性能F1值为57.16。最后，讨论了使用动词性谓词的特征实例来提高名词性谓词SRL的准确率，然而性能的提高并不是很明显。

相关文章 | 多维度评价

Select

3. 基于指代消解的中文事件融合方法

许荣华吴刚李培峰朱巧明

计算机应用 2009, 29 (08): 2264-2267.

摘要（1156）

PDF （644KB）（1142）

事件抽取是信息抽取领域的一个重要的研究方向。针对事件抽取获得的信息不完整和语义不明确的特点，在此基础上引入指代消解和信息融合理论，通过事件元素归一化和互指事件的合并，在数据和特征两个层次上对事件信息进行融合，进一步明确和完善事件信息，并在不损失信息的情况下精简整个信息系统的信息量。在裁员事件的融合实验中正确率达到86.9%。

相关文章 | 多维度评价

Select

4. 网格环境下基于分块的任务执行时间的预测算法

吉勤李培峰朱巧明马锋明

计算机应用 2009, 29 (07): 1874-1876.

摘要（1440）

PDF （607KB）（1059）

针对当前已有预测算法不实时、对负载变化不敏感的问题，结合网格中任务的特点提出新的基于分块的预测算法。该方法从子节点任务执行出发，提出把执行的任务分成两个部分，用前一部分的执行情况来预测剩下部分的执行时间。实验证明，该算法比已有预测算法有更高的效率和通用性。

相关文章 | 多维度评价

Select

5. 一种基于历史信息反馈的动态服务资源选择模型

许兰朱巧明李培峰贡正仙

计算机应用

摘要（1842）

PDF （623KB）（783）

针对真实服务网格环境中资源的不确定性，如CPU、网络的负载、安全性和动态性，提出了一种动态选择网格资源的技术——基于历史反馈的动态资源选择模型。该模型利用服务的历史执行信息自适应调整预测模型，并在考虑了网格环境中资源的实时性、安全性和不确定性的基础上，进行资源的反馈选择，最后将服务请求提交到整体性能较优的节点上。

相关文章 | 多维度评价

Select

6. 一个面向信息处理的双向文字处理算法IBidi

李培峰朱巧明钱培德

计算机应用

摘要（1344）

PDF （758KB）（751）

根据多文种信息处理中双向文字所存在的问题，提出了一种面向信息处理、具有自描述能力的双向文字处理算法IBidi。该算法首先对字符流进行预处理，主要对数字等特殊的字符进行标注；然后分析字符流，添加各种定义好的标签，用于描述字符的特性，供信息处理系统使用；最后，IBidi利用一个重新排序算法输出处理结果。该算法在典型测试样本上正确率达到96.7%，比Unicode的双向文字处理算法高出约17个百分点。另外，在随机样本测试中，IBidi的正确率也比Unicode的双向文字处理算法高5％左右。

相关文章 | 多维度评价

Select

7. 一个多文种语言Ontology框架的构建方法

李培峰朱巧明钱培德

计算机应用

摘要（1765）

PDF （1138KB）（780）

对语言Ontology进行了研究，提出了一个面向多文种信息处理的语言Ontology，给出了其设计思想、定义和推理机制，还描述了其结构和构建方法。该Ontology采用分层的树形结构，收录了具有语义的四类词：名词、动词、副词和形容词，并以词义和文种为类节点、词为叶子节点进行组织。能表示各个文种词汇的语义，并以语义为轴心进行融合，以提供不同文种间词汇的转换关系。另外，还提供了词汇语义相似度计算方法以及推理机制来对语义进行推理。

相关文章 | 多维度评价

Select

8. 基于相似页面的Web信息抽取系统的实现

贡正仙朱巧明李培峰

计算机应用

摘要（1561）

PDF （734KB）（1038）

分析了RoadRunner的核心算法，针对RoadRunner的不足，综合自动和半自动抽取阶段的各项研究成果，设计并实现了基于相似页面的Web信息抽取系统。介绍了系统结构和实现的关键技术，包括如何获取相似页面，可靠的噪声处理和自动归纳抽取规则的算法。

相关文章 | 多维度评价